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EfficientNet V2-S-Triplet7: 一 种 改进 的 星系 


形态 学 分 类 算法 * 
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摘要 星系 的 形态 与 星系 的 形成 和 演化 息息相关 , 其 形态 
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(辽宁 科技 大 学 理学 院 Bib 114051) 


学 分 类 是 


前 海量 天 文 观测 数据 的 出 现 使 得 天 文 数据 自动 分 析 方 法 
习 上 骨干 网 络 EfficientNetV2, 分 析 不 同 的 注意 力 机 制 类 型 


B 


RREI EE 


ZjEfficientNet V2-S-Triplet7 ( 即 在 EffcientNetV2-S stage7 的 1 x 1 卷 积 


来 实现 星系 形态 学 的 自动 分 类 . 使 用 第 二 期 星系 动物 园 (Galaxy Zoo 2, GZ2) 
数据 进行 实验 测试 . 在 对 数据 进行 预 处 理 时 采取 了 尺寸 抖动 、 翻 转 、 
的 不 平衡 问题 . 在 同一 系列 经 典 和 前 沿 的 深度 学 习 算 法 模型 AlexNet、ResNet-34、MobileNetV2、RegNet 进 


ERR MG Ja BER 


视 , 针对 此 问题 ， 


4 和 使 用 节点 对 


网 络 性 能 的 影响 ， 
层 后 加 入 Triplet 模 
中 超过 24 万 引 


究 的 重要 一 环 . 当 
先进 的 深度 二 


构建 了 一 种 命名 
央 ) 的 改进 算法 模型 
的 测 光 图 像 作为 初始 
色彩 畸变 等 图 像 增强 手段 来 解决 图 像 数 量 


行 对 比 实验 后 , 得 出 EB 人 hcientNetV2-S-Triplet7 算 法 在 分 类 准确 率 、 查 全 率 和 F1 分 数 等 指标 上 具有 最 好 的 测试 


H 
结果 


好 的 效果 . 


午 9375 张 测试 图 像 中 的 3 项 指标 值 分 别 可 达到 89.03%、90.21%、89.93%%, AME 


型 中 排 在 第 3 位 . 该 结果 表明 将 EfcientNetV2-S-Triplet7 算 法 


关键 词 技术 : 图 像 处 理 , 方法 : 数据 分 析 , 方法 : 分 类 , 星系 : 结构 
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1 515 
宇宙 中 的 星系 呈现 出 各 种 形状 、 颜 色 和 大 小 . 
这 些 特性 表明 了 它们 的 年 龄 、 形 成 条 件 以 及 在 许 
多 环流 过 程 中 与 其 他 星系 的 相互 作用 出 . 为 了 理解 
星系 的 形态 与 其 形成 机 制 之 间 的 关系 , 天 文学 家 展 
开 了 对 星系 的 形态 学 分 类 的 研究 目 . 应 用 最 广泛 的 
有 关 星 系 的 分 类 是 来 自 Hubble 于 1926 年 提出 的 分 
KRA, 即 著名 的 星系 分 类 “音叉 图" 回 . 早期 哈 勃 
的 分 类 系统 是 基于 人 眼 进行 观察 分 类 的 , 而 且 分 类 
的 程度 也 比较 粗糙 . 基于 “Hubble 音 又 图 ”, 后 来 的 
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天 文学 者 们 对 星系 形态 当 
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学 
EN 


多 种 更 为 细 化 的 目 视 分 ; 


应 用 于 大 规模 星系 数据 的 


和 叶 凯 士 系统 回 . 


由 于 基于 目 视 的 星 


判断 的 主观 时 


率 达 到 89.69%%, 在 其 他 模 


S 态 学 分 类 任务 中 有 很 


E RIEA 


类 , 所 以 学 者 们 发 展 了 新 型 


类 进行 了 发 展 , 提出 了 
, 如 德 沃 古 勒 系统 四 


分 类 方法 易 受 人 类 
CI, 且 无 法 完成 对 海量 星系 数据 的 分 
4 的 基于 计算 机 的 分 类 系 
统 , 包括 模型 化 分 类 系统 和 非 模型 化 分 类 系统 . 基 
于 星系 形态 不 同 , 星系 的 面 亮度 分 布 各 有 不 同 的 特 
点 , 用 不 同 的 经 验 律 对 星系 的 面 亮 度 轮廓 i 
的 分 类 系统 称 为 模型 化 分 类 系统 但 模型 化 分 类 系 


行 拟 合 
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统 也 有 其 自身 的 局 限 性 : 它 依赖 于 假定 的 函数 形式 ， 
没有 考虑 到 星系 可 能 存在 的 其 他 内 部 结构 等 . 为 
了 克服 这 些 问题 , 又 提出 了 非 模型 化 分 类 系统 , 这 
是 使 用 聚集 度 指 数 申 、 基 尼 指 数 门 等 结构 参量 对 星 
系 形态 进行 分 类 的 方法 . 相对 于 传统 的 方法 , 非 模 


者 和 计算 机 视觉 工作 者 参与 到 基于 深度 学 习 和 多 
的 星系 形态 学 分 类 方法 的 研究 中 . Dieleman 等 叫 首 


次 提出 进行 训练 使 用 的 模型 是 卷 积 神经 


Æ 


型 化 分 类 系统 的 优点 是 : 不 需要 提前 假定 星系 光度 
分 布 函数 , 可 以 完全 脱离 人 工 划分 , 使 用 计算 机 自 
动 分 类 , 也 能 适用 于 大 样本 数据 分 类 研究 . 此 外 , 表 
征 星系 形态 的 结构 参量 具有 丰富 的 物理 内 涵 , 星系 
的 形成 历史 和 演化 与 其 密 不 可 分 , 因此 它们 在 不 同 
红 移 的 形态 学 分 类 研究 中 的 应 用 越 来 越 广泛 站. 
随 着 科学 技术 的 飞速 发 展 , 观测 技术 也 取得 
了 较 大 进步 , 逐步 建立 了 以 斯 隆 数字 巡天 (Sloan 
Digital Sky Survey, SDSS)! 为 代表 的 大 天 区 星系 
图 像 巡 天 计划 , 观测 得 到 的 星系 数据 增长 十 分 迅 


Hc 


awaii Telescope Lensing Survey)? rf If] A 


i 


im 
nr 


网 络 , 使 


的 训练 集 也 超过 了 5 万 张 , 最 终 取 得 的 均 方 根 
值 为 0.07492. 同时 , Dieleman UZR T ERR 
的 旋转 和 翻转 不 变性 . Kim 等 0 利用 SDSS DR12 
Data Release 12) 和 CFHTLenS (Canada-France- 
EA. fü 
图 像 作为 数据 集 , 提出 了 一 个 可 以 用 于 二 分 类 
的 深度 为 11 层 的 卷 积 神经 网 络 , 测试 集 上 恒星 和 星 


系 的 分 类 准确 率 分 别 达 到 了 99.52% 和 99.48%. RE 
明 等 0 引 基 于 旋涡 星系 、 侧 向 星系 等 5 类 星系 形态 分 
类 问题 , 设计 了 ResNet-26 算 法 , 这 是 一 个 改进 的 深 


度 残 差 网 络 的 分 类 框架 , 在 测试 集 上 准确 
了 95.2%. Goyal 等 9 采用 基于 卷 积 神经 网 络 的 顺 


Tin. 因此 , 在 星系 形成 和 演化 的 物理 研究 方面 , 使 用 
人 工 对 海量 星系 数据 进行 分 类 显得 不 再 可 行 . 随 着 
机 器 学 习 迅 速成 为 自动 化 数据 密集 型 处 理 过 程 的 
首选 工具 , 许多 天 文 工 作 者 也 考虑 将 其 应 用 到 天 文 
数据 处 理 中 . 例如 , 人 工 神经 网 络 (Artificial Neural 
Network，ANN)B、 朴 素 贝 叶 斯 (Naive Bayes)!9l, 
决策 树 (Decision Tree)u0 和 局 部 加 权 回 归 (Locally 
Weighted Regression)!!! GAAF TH + MHF 
相对 较 小 数据 集 的 星系 分 类 任务 中 . 后 来 , 大 规 
模 数 据 的 发 展 为 机 器 学 习 在 星系 分 类 任务 中 的 应 
提供 了 驱动 力 . Cheng 等 上 3 先 将 10 种 传统 机 器 学 
习 方 法 应 用 于 星系 动物 园 (Galaxy Zoo，GZ) 数 据 
集中 , 再 使 用 监督 学 习 校 正 分 类 错误 星系 的 标签 ， 
在 椭圆 星系 和 旋涡 星系 的 二 分 类 任务 中 达到 了 
超过 0.99 的 准确 率 . Zhang 等 31 引 入 了 一 种 基于 少 
样本 学 习 (Few-shot learning) 策 略 的 SC-Net (Self- 
Calibrated Convolutions), 该 模型 与 AlexNet 相 比 ， 
在 仅 含 1000 张 星系 图 像 的 训练 集 上 的 分 类 准确 率 
提高 了 21%. 

深度 学 习作 为 更 复杂 的 机 器 学 习 模 型 , 在 大 
规模 数据 中 表现 更 佳 . 近年 来 , 越 来 越 多 的 天 文学 

lhttps://www.sdss.org 


2https://www.cfhtlens.org/ 
3https://www.galaxyzoo.org/ 


^https:/ /www.efigi.org 


5https:/ /www.kaggle.com/c/galaxy-zoo-the-galaxy-challenge 
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序 分 层 结构 和 数据 增强 技术 , 将 星系 分 为 椭圆 星 
系 、 透 镜 星 系 和 旋涡 星系 3 大 类 . 模型 的 平均 训练 
准确 率 达 到 了 90.2%, 平均 验证 准确 率 为 88.3%. E 


林 倩 等 上 7 利用 SDSS DR16、 星 系 动物 园 2 


率 达 到 


(Galaxy 


Zoo 2, GZ2)3、EFIGI (Extraction de Formes Ide- 


alisées de Galaxies en Imagerie)? H 3x P A 


星系 的 测 


光 图 像 , 提出 了 一 种 名 为 GMC (Galaxy Morpho- 


logical Classification) 的 星系 形态 学 分 类 方 


法 , 在 旋 


涡 星系 、 椭 圆 星系 、 透 镜 星系 以 及 不 规则 星系 分 
类 问题 上 达到 98.93% 的 准确 率 . SER c EOS) Ai Fg] 
戴 佳明 等 25 使 用 的 数据 集 , 基于 EffcientNet-B5 模 


型 , 达到 了 96.76 狼 的 分 类 准确 率 . 


然而 , 近年 来 学 者 的 分 类 问题 研究 多 致力 于 


Kaggle 平 台 Galaxy Zoo-The Galaxy Challenge? 的 
数据 集 , 其 星系 数量 约 有 14 万 . 本 文 则 针对 GZ2 中 
超过 24 万 的 数据 量 , 基于 EfficientNetV2-SH9 网 络 


对 其 进行 改进 , PRA Triplet? i 3x JRR 


模型 特征 提取 的 能 力 . 并 结合 尺寸 抖动 、 翻 转 、 色 


, 提高 了 


彩 畸 变 等 数据 增强 技术 , 提高 数据 集 的 多 样 性 , 降 


低 了 过 拟 合 , 使 得 在 椭圆 星系 、 有 核 球 侧 


无 核 球 侧 向 星系 、 旋 涡 星 系 、 棒 旋 星 系 和 扰动 星 


向 星系 、 
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系 6 分 类 任务 上 的 准确 率 均 有 所 提高 
2 数据 
本 文采 用 的 实验 数据 全 部 来 自 GZ2. 本 节 主 要 


介绍 本 文 使 用 的 数据 集 及 其 获取 、 数 据 预 处 理 过 
fE. 
2.1 ”GZ2 数 据 集 


GZ2 是 一 个 要 求 参 与 者 描述 基于 彩色 图 像 的 
星系 形态 的 在 线 众 包 项 目 , 其 中 超过 1600 万 的 形态 
学 分 类 来 自 SDSS 释 放 的 约 30 万 个 星系 数据 . 参与 
者 会 被 问 到 各 种 各 样 的 有 关 星 系 形 态 学 的 问题 , 这 


星系 、 旋涡 星系 、 棒 旋 星 系 和 扰动 星系 . (d) 表 
示 扰 动 星系 .fsmootn 表 示 一 张 图 片 是 平滑 星系 
的 概率 ; fin betweea 表 示 一 张 图 片 是 中 间 星 系 的 
概率 ; 万 seauesvaisk 表 示 一 张 图 片 有 盘 状 结构 的 
概率 ; fedge-on, ys 表示 一 张 图 片 是 侧 向 星系 的 
概率 ; fouge, yes 表 示 一 张 图 片 有 核 球 结构 的 概 
率 ; fouge, no 表示 一 张 图 片 无 核 球 结构 的 概率 ; 
feage-on, no 表示 一 张 图 片 不 是 侧 向 星系 的 概率 ; 
fa bar through the centre, ae 张 图 F 中 间 没有 棒 
状 结构 的 概率 ; fspiray yes 表 示 一 张 图 片 是 旋涡 星 
系 的 概率 ; fa bar through the centre, ves 表 示 一 张 图 片 中 
间 有 棒状 结构 的 概率 . NI 代表 依据 闵 值 标准 直接 


些 问 题 作 为 标准 形成 了 一 个 决策 树 . 分 类 方案 中 共 
(TO01-T11) 和 37 个 答案 (如 T01.1 表 


设计 了 11 个 问题 
示 第 1 个 问题 的 第 1 个 答案 ), 这 37 个 答案 分 别 对 应 


在 GZ2 数 据 中 选取 出 的 星系 图 像 数 量 , N2 代 表 删 除 
了 带 有 重复 标签 的 星系 图 像 数 量 , N3 代 表 进 行 数据 
增强 后 星系 图 像 数量 . 


37 个 独立 的 类 别 . 事实 上 , 其 中 一 些 类 别 有 许 多 共 


表 1 的 闵 值 标准 来 自 GZ2 的 闵 值 选取 规则 , 官 


同属 性 . 由 于 决策 树 的 结构 , 每 个 参与 者 只 回答 ] 
每 个 分 类 问题 的 一 个 子 集 . 当 许 多 参与 者 对 同一 图 
像 进行 分 类 时 , 他 们 的 答案 被 聚合 成 一 组 关于 整个 
b ucl. 这 些 投票 分 数 用 于 估计 每 

答案 的 置信 水 平 , 并 指出 用 户 在 对 图 像 进行 分 类 
iii 困难 程度 . 共有 超过 50 万 人 参与 了 该 分 
类 工作 , 每 张 图 片 都 由 40-50 人 独立 分 类 B21. 

GZ2 中 的 数据 是 尺寸 为 424 x 424 x 3 像素 的 
RGB 图 片 , 其 测 光 数据 来 自 于 SDSS. 事实 上 , SDSS 
得 到 的 是 含有 u、g、r、i 和 和 z 这 5 个 波段 的 原始 数据 ， 
但 是 u 和 z 波 段 大 多 是 近 红 外 和 近 紫 外 , 包含 的 有 用 
信息 比较 少 , 因此 在 合成 相对 应 的 RGB 图 像 时 , 一 
般 只 选用 g、r、i 这 3 个 波段 的 信息 . 

来 自 GZ2 项 目的 数据 已 经 被 广泛 用 于 关于 星 
系 结构 、 形 成 和 演化 的 研究 . 将 GZ2 的 形态 与 来 自 
权威 天 文学 专家 和 自动 分 类 的 较 小 样本 进行 比较 ， 
结果 显示 出 了 高 度 的 一 致 性 , 进而 证 明了 众 包 注 释 
的 准确 性 . 所 以 本 文采 用 的 GZ2 数 据 具 有 较为 准确 


的 分 类 标签 . 
2.2 ”数据 准备 
表 1 中 为 筷 选 6 类 星系 图 像 数 据 的 阔 值 标准 , 6 


类 星系 的 类 别 标 签 0、1、2、3、4、5 分 别 代 
表 椭 圆 星系 、 有 核 球 侧 向 星系 、 无 核 球 侧 癌 


Jj A HAY BU 0.8, 无 核 球 侧 向 星系 适当 
放宽 至 0.5, 同时 还 要 满足 所 有 条 件 概 率 值 相 
乘 大 于 0.5. 比如 , 对 于 有 核 球 侧 向 星系 ,筛选 
的 是 所 有 满足 ficoatwres/aisk > 0.43、 fedge-on, yes > 
0.602、 fbuige, yes > 0.841 freatures/disk x fied on ye 
x fouge, yes > 0.5 的 交集 图 片 . 

1 X tH #770453% Ed Fr F, 有 329 张 星系 图 片 
琵 分 在 了 旋涡 星系 又 分 在 了 扰动 星系 A2595K 
既 分 在 了 棒 旋 星系 又 分 在 了 扰动 星系 , 这 不 符合 
深度 学 习 数 据 集 的 要 求 , 因此 删 掉 这 1176 张 图 片 ， 
共 得 到 75869 张 星系 图 片 . 选取 后 椭圆 星系 、 有 核 
球 侧 向 星系 、 无 核 球 侧 向 星系 、 旋 涡 星 系 、 棒 
旋 星系 和 扰动 星系 图 片 数 量 分 别 为 22897、9157、 
2419、23992、15888、1516 张 . 我 们 发 现 , 无 核 球 
侧 向 星系 和 扰动 星系 的 数量 较 少 , 样本 类 别 数量 
不 平衡 , 不 利于 模型 充分 学 习 各 个 类 别 的 特征 信 
息 . 所 以 采用 数据 增强 的 方式 扩充 无 核 球 侧 向 星 
系 和 扰动 星系 的 数量 . 这 两 类 样本 (2 和 5) 数 量 分 别 
H2419 和 1516 扩 充 到 9676 和 12128 个 , 6 种 类 别 的 总 
样本 数 由 75869 扩 充 到 93738 个 . 本 文采 用 的 数据 增 
强 方式 如 下 : 

旋转 : 旋转 不 变性 是 星系 图 像 特有 的 一 种 性 
质 , 利用 图 像 的 该 性 质 对 图 像 在 -30° 到 30° 范 围 内 
进行 随机 旋转 . 


juni 
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翻转 : 水 平 旋转 和 垂直 翻转 . 这 样 就 消除 了 模 随机 分 层 抽 取 , 划分 为 训练 集 、 验 证 集 和 测试 集 . 
型 对 于 不 同方 向 的 星系 分 类 可 能 存在 的 差异 . 表 2 详 细 展 示 了 训练 集 、 验 证 集 和 测试 集中 每 一 类 
色彩 畸变 : 包括 改变 亮度 、 对 比 度 、 饱 和 度 和 星系 图 像 的 数目 , 为 了 保证 实验 的 科学 性 和 准确 
色调 , 以 便 严 格 保留 星系 的 形态 信息 . E, 3 个 数据 集中 各 类 别 星系 图 像 数目 是 同比 例 分 

将 93738 张 干净 样本 按 8:1:1 的 比例 在 各 类 别 中 布 的 . 


R 


— 


表 1 星系 样本 数据 选取 标准 


Table 1 Selection criteria for sample data of galaxies 


Class Task Threshold setting N1 N2 N3 

0 TO1.1 fsmooth > 0.469 22897 2289 22897 
工 07.2 fin between > 0.8 

1 T01.2 fieatures/disk > 0.430 9157 9157 = 9157 
'T02.1 fedge-on, yes > 0.602 

T09.1&.2 fbulge, yes > 0.8 

2 工 01.2 fieatures/disk > 0.430 2419 2419 9676 
T02.1 fedge-on, yes > 0.602 
T09.3 foulge, no > 0.5 

3 工 01.2 ffeatures/disk > 0.430 24321 23992 23992 
T02.2 feage-on, no > 0.715 
T03.2 fa bar through the centre, no > 0.8 
T04.1 spirat, yes > 0.619 

4 工 01.2 ficatures/disk > 0.430 16147 15888 15888 
'T02.2 feage-on, no > 0.715 


T03.1 fa bar through the centre, yes > 0.8 
T04.1 fspiral, yes > 0.619 
5 (d) 2104 1516 12128 
Total 77045 75869 93738 


表 2 划分 后 6 种 类 别 的 星系 样本 统计 


Table 2 Statistics of six categories of the galaxy sample after partition 


Data type 0 1 2 3 4 5 Total 


Training set 18317 7325 7740 19193 12710 9702 74987 
Validation set 2290 916 968 2399 1589 1213 9735 
Test set 2290 916 968 2400 1589 1213 9736 
Data set 22897 9157 9676 23992 15888 12128 93738 
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种 改进 的 星系 形态 学 分 类 算法 


2.3 ”数据 预 处 理 


天 文 图 像 含有 很 多 元 余 的 信息 , 选取 后 的 训练 


依次 为 愿 图、 裁剪、 缩放、 随机 翻转 4 
具体 说 明 如 下 . 


测试 样本 的 真实 性 , 验证 集 和 测试 集 的 数据 预 处 理 
方式 较为 简单 , 与 训练 集 的 处 理 方式 有 所 不 同 . 

训练 集 图 像 预 处 理 流程 如 图 1 所 示 , 从 左 到 右 
成 的 图 片 ， 


集 、 验 证 集 、 测 试 集 星系 图 片 不 能 直接 进行 训练 ， 
输入 模型 前 需要 进行 数据 预 处 理 . 为 了 保证 验证 和 


每 次 迭代 , 都 能 获得 随机 的 裁剪 尺寸 , 从 而 大 大 增 
加 训练 集 的 数量 , 有 效 避 免 过 拟 合 . 


(2) 缩 放 : 降低 图 像 分 辩 率 . 将 图 
90 pixel 大 小 , 这 样 虽然 减少 了 图 


(ORBI: 星系 图 像 数 据 带 有 大 量 天 空 背景 , 我 
们 感 兴趣 的 目标 位 于 中 间 , 裁剪 可 以 消除 周围 噪声 . 
本 文采 用 尺寸 抖动 的 方法 , 将 424 x 424 pixel 尺 寸 
抖动 到 [220, 260], 即将 图 片 像素 裁剪 到 220 到 260 的 
任意 一 个 整数 . 这 种 策略 可 以 使 每 张 训 练 图 像 经 过 


424x424x3 


但 是 可 以 保证 不 丢失 数据 的 和 
(3) 随 机 翻转 : 以 0.5 的 概率 对 图 像 进行 随机 水 
平 翻转 和 随机 垂直 翻转 . 这 样 就 消除 了 模型 对 不 同 
方向 的 星系 解释 上 可 能 存在 的 差异 . 


FE 何 特征 . 


片 缩 放 到 90 x 


像 中 包含 的 


Hs 


验证 集 和 测试 集 处 理 步 骤 相 对 简单 . 先 中心 裁 


88 $0240 x 240 pixel, 再 缩放 3 
训练 集 、 验 证 集 和 测试 集 的 RGB 图 像 先 转 为 张 量 ， 


S=[220,260](224x224x3) 


a4 


B90 x 90 pixel. 将 上 述 


再 分 别 按 通道 进行 标准 化 , 即 先 减 去 平均 值 再 除 以 


标准 差 , 其 中 通道 分 别 为 H (Height). W (Width), 


C (Channel). 


Epi 训练 集中 一 个 有 核 球 侧 向 星系 的 预 处 理 过 程 (asset .id = 10508) 


90x90x3 


90x90x3 


Fig.1 Preprocessing of an edge-on with bulge galaxies in the training set (asset_id = 10508) 


3 ”模型 架构 


卷 积 神经 网 络 (Convolutional Neural Net- 
works，CNN) 通 常 包 含 卷 积 层 、 池 化 层 和 全 连接 
层 , 常 被 设计 用 于 处 理 图 像 数据 名 ,是 深度 学 习 
的 代表 算法 之 一 凶 . 本 节 介 绍 实验 中 使 用 的 一 些 


主要 模型 架构 ,3.1 节 介绍 了 高 效 卷 积 神经 网 络 


EfficientNetV2, 并 对 EfficientNetV2-S 


9 网 络 架构 


进行 详细 介绍 , 3.2 节 对 我 们 改进 的 算法 模型 进行 


16- 


介绍 . 


3.1 EfficientNetV2 介 绍 


EfficientNetV2 是 1 
一 组 基于 CNN 的 主干 


NetV2 网 络 不 仅 在 准确 


ie KF, 而 且 训 练 


的 模型 其 中 EffcientNetV2-S 结 构 如 表 3 所 示 . 


Tan 等 19] 在 2021 年 发 布 


KF fi 


E $e AY PX) 28. Efficient- 
率 方 面 达 到 了 当时 
速度 更 快 、 参 数 数 量 
少 . EfflcientNetV2 系 列 共有 8S、 


M、 工 这 3 个 不 


的 


的 
更 
同 
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EfficientNetV2-S'F J£ @8 stage, Conv3x3x: 指 
3x 348 FRE, Fused-MBConv1 #llFused-MBConv44} 
别 指 Fused-MBConv 中 通道 数 为 1 和 4，k3x3 指 卷 
积 核 的 尺寸 为 3x3，SE0.25 指 SE (Squeeze-and- 
Excitation) 模 块 中 全 连接 层 (Fully Connected, 
FC) 中 的 节点 数 占 特征 和 矩阵 的 0.25，Pooling 是 
池 化 层 . 另外 ,BfficientNetV2-S 是 基线 网 络 . M, 
L 在 S 的 模型 框架 基础 上 增加 了 网 络 复 杂 度 ， 
在 提升 网 络 性 能 的 同时 , 仅 增加 了 较 少 的 计 
算 成 7k. EfficientNetV2 5 EfficientNet 4l z& 列 JH 
比 , 除了 使 用 MBConv (Mobile Inverted Bottle- 
neck Convolution)", 还 在 网 络 浅 层 使 用 Fused- 
MBConvU9, 解决 了 在 大 尺寸 的 训练 图 像 上 训练 
速度 慢 的 问题 . 同时 , EffcientNetV23 引 入 渐进 式 学 
习 策 略 , 能 够 根据 训练 图 像 的 尺寸 动态 调整 正则 
化 方法 . 该 策略 不 仅 能 够 提升 准确 率 , 同时 还 能 提 
升 训练 速度 . Fused-MBConv 相 较 于 MBConv 减 少 
了 Depthwise 卷 积 块 , 其 详细 结构 如 图 2 所 示 . 其 中 ， 


^H, W, 4C” 指 将 输入 卷 积 层 的 特征 矩阵 的 通道 数 
BNA, “H, W, C” 指 不 做 任何 扩充 . 


Ce Cp. 
H,WC | H,W,C | 
/ Conv1x1 / Conv1x1 * 
ry 4 
[ se | | 
H,W4C | | H,W,4C | 
| Y 
Depthwise 
Conv3x3 | | 
r1 \ / 
| Conv3x3 | 
\. Conv1x1 7 | 
H,W,C H,W,C | 
| 
MBConv Fused-MBConv 


图 2 ”MBConv 和 Fused-MBConv 的 结构 [1 


Structures of MBConv and Fused-MBConv!"®! 


Fig. 2 


表 3 EfficientNetV2-S 的 结构 
Table 3 EfficientNetV2-S structure 


Stage Operator Stride #Channels #Layers 
0 Conv3x3 2 24 1 
1 Fused-MBConvl, k3x3 1 24 2 
2 Fused-MBConv4, k3x3 2 48 4 
3 Fused-MBConv4, k3x3 2 64 4 
4 MBConv4, k3x3, SE0.25 2 128 6 
5 MBConv6, k3x3, SE0.25 1 160 9 
6 MBConv6, k3x3, SE0.25 2 272 15 
T Conv1 x 1 & Pooling & FC - 1792 1 


3.2 ”改进 后 模型 架构 

EfficientNets 经 历 了 从 EfficientNet 到 Efficient- 
NetV2 的 更 新 , E 仙 cientNet 包 括 BO 至 B7 共 8 个 模型 ， 
它们 具有 相同 的 结构 框架 . E 重 cientNet-B0 是 基线 
网 络 , 其 他 均 在 输入 图 像 分 辨 率 、 网 络 深度 方面 
作 了 扩展 , 以 方便 处 理 不 同 大 小 的 图 片 . 我 们 在 


EfficientNetJ8 模 型 和 EffhcientNetV2 的 3 个 模 
型 上 分 别 进行 实验 , 选 出 了 在 该 星系 图 像 
数据 集 上 表现 最 好 的 模型 EfficientNetV2-S. 
FKH Alex-Net??5], ResNet-34?°, MobileNet- 
V2B273 和 RegNetB3al 等 经 典 卷 积 神经 网 络 进行 对 
比 , 前 者 表现 出 更 好 的 分 类 性 能 . 因此 我 们 
考虑 对 模型 FE 外 cientNetV2-S 进 行进 一 步 改 进 . 
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Efficient Net V2-S-Triplet7: 一 种 改进 的 


星系 形态 学 分 类 算法 


EfficientNetV2-S 中 使 用 的 注 


意 力 机 制 模 块 


ESEP ER, SE 模块 是 对 特征 图 进行 二 维 全 局 


池 化 操作 , 通过 压缩 操作 将 高 维 的 全 
为 低 维 的 特征 向 量 , 以 此 提取 通道 级 的 


局 特征 图 转化 
全 局 特征 ， 


进而 用 多 层 感知 机 进行 非 线性 特征 变换 . 其 更 多 关 


al 


注 通道 


间 的 信息 , 而 
为 了 让 模型 能 够 结合 不 同 注意 


铬 了 空间 信息 . 


意 力 机 制 的 优点 ， 


A 


进一步 增强 模型 的 特征 提取 能 力 , 我 们 考虑 以 下 3 


种 加 入 注意 
(1) 在 表 3 的 stage0 的 3 x 3 卷 积 后 


力 模块 的 方法 : 
分 别 加 入 SE、 


CBAM (Convolutional Block Attention Module) B°, 
ECA (Efficient Channel Attention)®, CA (Co- 
ordinate Attention) PAM Triplett A JER. 

(2) 将 stagel-6 的 SE 换 成 CBAM、ECA、CA 和 
Triplet 模 块 . 

(3) 在 stage7 的 1 x 1 卷 积 后 分 别 加 入 SE、CB- 


AM, ECA, 


Input Tensor 


更 进 一 


CA 和 Triplet 注 意 力 模 块 . 


E 


H 


v d 
Ly. £3 
ci Ww 00 onv e 
(2 


53 ”Triplet 结 构 


SE、ECA 为 通道 注意 力 机 制 , CBAM、CA 和 


Triplet 是 通道 和 空间 


H, Triplet 注 意 力 机 


度 的 交互 信息 来 计算 注意 力 


th 


言 息 相 结合 的 注意 力 机 制 . 
| 的 创新 点 在 于 可 以 获取 跨 维 
权重 , 同时 建立 起 维度 


N 


之 间 的 依存 关系 , 而 对 通道 信息 和 空间 信息 进 


编码 的 计算 开销 


益 于 Triplet 重 要 的 三 


m 


分 支 结 构 . XX 


出 完成 了 通 


行 


是 很 小 的 , 可 以 忽略 Po. 以 上 都 得 
E, AEBU 4 
道 与 空间 信息 的 跨 通道 交互 , 在 增强 


模型 表征 能 力 的 同时 , 还 能 抑制 无 效 信 息 的 干扰 ， 


提升 模型 的 鲁 棒 性 . 


Triplet 的 结构 如 


m 


图 3 所 示 . 


中 , 第 1 个 分 支 用 于 实现 通道 信息 C 和 高 度 信息 本 的 


路 维度 交互 , Z-Pool 指 最 大 池 化 或 
指 7 x 7 卷 积 层 ; 第 2 个 分 支 用 于 实现 通道 


ZW 


F 均 池 化 , Conv 
A 息 C 和 帘 


度 信息 W 的 跨 维度 交互 ; 第 3 个 分 支 最 后 对 特征 进 


行 重 
平均 值 . 


H 


—> 
WwW 


H 


Sigmoid 
dios perie g D 
© 


Sigmoid 
| e 
Identity | = m x 


gj [20] 


Fig.3 Structure of Triplet!?° 


步 , 我 们 将 在 EfficientNetV2-S 中 stage7 


的 1 x 1 卷 积 层 后 加 入 Triplet 注 意 力 模块 的 模型 
PK ZjEfficientNetV2-S-Triplet7. 图 4 展示 了 改进 前 


EfficientNetV2-S 中 stage7 的 结构 图 ， 
Xt Jri EfficientNet V2-S-Triplet7Hstage7 的 结构 图 . 


图 5 展示 了 改 


Conv1x1 | Pooling — FC 


4 EfficientNetV2-S'Pstage7 MJ Z&d4 


Fig.4 Structure of stage7 in EfficientNetV2-S 


pu | 
1 
I 
1 
1 
I 
I 
I 


HEF. Aveta 34r a> ci Hh RF iE WE AT A Dok 


4 


Triplet Attention 


nput 


Ne 


| convi | | Triplet | 


: Pooling | : FC | 


图 


5 EfficientNetV2-S-Triplet7 中 stage7 的 结构 区 


Fig.5 Structure of stage7 in EfficientNetV2-S-Triplet7 


4 实验 过 程 与 


4.1 评价 标准 


结果 


在 分 类 问题 中 , 有 关 样 本 真实 类 别 与 模型 预测 


类 别 的 组 合 的 混 消 铅 


E 阵 如 表 4 所 示 , FLT 


FE 估 分 类 
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Ti A ME REF 
准确 率 : 


Accu 


查 准 率 : 


查 全 率 : 


天 学 报 2} 
中 标 表 示 如 下 [3 . F1 分 数 
F1 — score = 2x Lesion x Recall (4) 
TP +TN " Precision + Recall 
racy — : 
TP + TN + FP + FN ROCH 2& (Receiver Operating Characteristic 
Curve) AUC (Area Under Curve): 在 预测 任务 
= f 是 分 类 学 习 器 , 对 于 一 个 样本 数量 为 m 样 例 集 
TP H 
Precision = TP + FP ; (2) M = {(z1, yı), (x2, yz). , (Em, Va) ^N 中 yj 是 zx; 
BH Reli, ROOM BR Ne AE [EAE 
2. AUC 为 ROC 曲 线 下 的 面积 , AUC 可 估算 为 : 
TP T < 
Recall = TP LEN (3) AUC = 2 2 Cac) X (yi + Yiz). X) 
表 4 分 类 结果 混淆 矩阵 
Table 4 The confusion matrix of classification result 
Predict label 
Positive Negative 
True label 
Positive True Positive (TP) False Negative (FN) 
Negative False Positive (FP) True Negative (TN) 


4.2 ”实验 环境 及 参数 


本 文 所 用 计算 机 的 硬件 
(R) CPU E5- 


存 , NVIDIA 


环境 为 Intel (R) Xeon 
2640 v4 @ 2.40 GHz 处 理 器 , 32 GB 内 
GeForce RTX 3080 Ti 显卡 , 软件 环境 


为 64 位 Windows10 操 作 系统 . 所 有 实验 均 基 于 深度 


学 习 框 架 Pytorch, 所 

在 训练 过 程 中 , 我 们 采用 随机 初始 权重 . 首 
FEAR HI AE SCRA (Cross Entropy Loss) 函 数 计算 
; 然后 采 
法 优化 网 络 参 数 , 动量 为 0.9, 权重 衰减 为 


损失 值 


scent) § 


开发 语言 为 Python3.8. 


1SGD (Stochastic Gradient De- 


0.0001, 使 用 
置 为 32. 


4.3 ”实验 


余弦 退火 衰减 学 习 率 , 批 处 理 大 小 设 


结果 
针对 2.2 节 提 到 的 样 
机 旋转 、 随 机 翻转 、 色 彩 


本 不 平衡 问题 , 我 们 通过 随 
ee May A556 7 VY TC AZ ER A T3] 


型 AlexNet、 


星系 和 挑动 星 


系 进 行 数据 增强 策略 , 并 基于 网 络 模 


ResNet、 EfficientNet-BO#lEfficient- 


证 了 数据 增强 策略 的 有 效 性 . 
紧 接 
Net V2-S, 


M. LÈ 


te 


NetV2-S 进 行 实验 对 比 , 实验 结果 如 表 5 所 示 . 从 表 5 
数据 可 以 看 出 , 经 过 数据 增强 后 ， 
Net. EfficientNet-BO#lEfficientNetV2-S H% ll i f 
FESS AUPE I 1.5396. 196. 0.829601 1.1196, 这 验 


AlexNet. Res- 


, A SOX} EfficientNet-B0 € B7. Efficient- 
他 经 典 深 度 学 习 模 型 进行 
1 练 和 测试 , 实验 结果 如 表 6 所 示 . 其 
NetY 是 在 RegNetX 中 插入 SEE 机 周 
F 比 200-MF 具 有 更 复杂 的 结构 . 


中 ，Reg- 


1 得 到 的 ，400M- 


表 6 结 果 显示， 


EfficientNetV2-S 的 4 项 评价 


MI 
T 


7389.6596, Fl 分 Bt 为 89.52%. 
B EfficientNetV2-SZE AS xc AY qf E 


指标 都 是 最 高 的 ， 
M ik HE Wh K 73988.6496, E VE XS 89.45%, AA 


基于 此 我 们 发 
到 星系 、 有 核 球 
侧 向 星系 、 无 核 球 侧 向 星系 、 旋 涡 星系 、 棒 旋 星 
系 和 扰动 星系 6 分 类 任务 上 有 更 好 的 特征 提取 能 

因此 , 我 们 选择 EffhcientNetV2-S 模 型 进行 改 i 
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表 5 数据 增强 前 后 的 分 类 结果 对 比 


Table 5 Comparison of classification results before and after data augmentation 


Model Accuracy without data augmentation Accuracy with data augmentation 
AlexNet 84.55% 86.08% 
ResNet 86.88% 87.88% 
Efficient Net-BO 86.93% 87.75% 
EfficientNetV2-S 87.5396 88.6496 


A60 各 深度 学 习 模型 性 能 比较 


Table 6 Performance comparison of various deep learning models 


Model Accuracy Precision Recall F1-score 
EfficientNet-BO 87.75% 88.42% 88.52% 88.40% 
EfficientNet-B1 87.93% 88.99% 88.43% 88.65% 
Efficient Net-B2 88.07% 88.99% 88.83% 88.88% 
EfficientNet-B3 88.33% 88.78% 89.50% 89.04% 
Efficient Net-B4 88.00% 89.23% 88.62% 88.89% 
EfficientNet-B5 87.97% 88.47% 88.98% 88.68% 
Efficient Net-B6 88.56% 89.19% 89.60% 89.33% 
Efficient Net-B7 88.01% 88.60% 89.11% 88.80% 
EfficientNetV2-S 88.64% 89.45% 89.65% 89.52% 

Efficient Net V2-M 88.32% 89.17% 89.61% 89.37% 
EfficientNet V2-L 87.98% 88.51% 88.88% 88.66% 
AlexNet 86.08% 86.33% 86.48% 86.61% 
ResNet-34 87.88% 89.14% 88.73% 88.88% 
MobileNet V2 86.85% 87.58% 87.64% 87.58% 
RegNetX-200MF 83.69% 84.56% 84.09% 84.30% 
RegNet Y-400MF 85.41% 86.26% 85.55% 85.84% 


4.4 EfficientNetV2-S 改 进 模型 的 实验 结果 与 
分 析 

为 了 使 EfficientNetV2-S 的 改进 策略 更 加 有 效 ， 
我 们 考虑 在 EffcientNetV2-S 算 法 的 stage0、stage7 
IRASE, CBAM, ECA, CAflTriplet#ish, 或 者 
将 stagel-6 中 的 SE 模块 换 成 其 他 4 种 注意 力 模块 . 

实验 结果 如 表 7 所 示 . 表 中 模型 pfficientNetV2- 
S-SEO. Efficient Net V2-S-CBAM0, Efficient Net V2- 
S-ECAO0. EfficientNet V2-S-CA0#lEfficient Net V2- 


S-Triplet0 分 别 代表 在 stage0 的 3 x 3 卷 积 后 分 别 加 
入 SE、CBAM、ECA、CA 和 Triplet 模 块 ; Efficient- 
Net V2-S-CBAM, EfficientNet V2-S-ECA、 Efficient- 
NetV2-S-CA 和 EffhcientNetV2-S-Triplet 分 别 代 表 将 
EffcientNetV2-S 中 stagel1-6 的 SE 注意 力 机 制 换 成 
CBAM, ECA、CA 和 Triplet 模 块 ; 模型 BfficientNet- 
V2-S-SE7、 Efficient Net V2-S-CBAM7, Efficient Net- 
V2-S-ECA7, Efficient Net V2-S-CA7#ll Efficient Net- 
V2-S-Triplet7 分 别 代表 在 stage7 的 1 x 1 卷 积 后 分 别 
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发 现 , 在 stage0 后 力 


准确 率 都 有 不 同 程 


后 


CBAM、ECA 注 意 力 机 制 的 模 
上 升 了 0.04% 和 0.31%. 而 对 于 在 stage7 的 1 x 1 卷 积 
加 入 5 种 注意 力 机 制 的 模型 来 说 , 只 有 加 入 CBAM 


型 分 类 


加 入 SE、CBAM、ECA、CA 和 Triplet 模 块 . 我 们 
I 入 5 种 注意 力 机 制 的 的 模 
度 的 下 降 . 将 stagel1-6 的 SE 换 成 
准确 率 分 别 


型 分 类 


模块 的 模型 7 


Em FPE T 0.47%, 


其 他 均 有 提升 . 


中 在 stage7 的 1 x 1 卷 积 后 加 入 Triplet 模 块 的 模型 达 
到 89.03%% 的 准确 率 、90.21% 的 查 全 率 、89.93% 的 Fl 


分 数 , 高 于 其 他 各 种 改 i 


V2-S-Triplet7 与 未 改进 
确 率 提高 了 0.39%. 


表 7 在 EfficientNetV2-S 插 入 注意 力 模块 的 实验 结果 


Table 7 Experimental results of inserting attention module in Efficient NetV2-S 


模型 . 同时 , EfficientNet- 


HIEfficientNet V2-S4H EE EE 


Model Accuracy Precision Recall F1-score 
EfficientNetV2-S-SEO0 88.4996 89.4296 89.39% 89.37% 
EfficientNet V2-S-CBAMO 88.27% 89.0196 89.2296 89.07% 
Efficient Net V2-S-ECA0 88.29% 88.95% 89.37% 89.13% 
Efficient Net V2-S-CAO0 87.43% 88.55% 88.25% 88.38% 
Efficient Net V2-S-Triplet0 88.10% 88.80% 89.09% 88.92% 
Efficient Net V2-S-CBAM 88.68% 89.52% 89.97% 89.72% 
Efficient Net V2-S-ECA 88.95% 89.87% 89.9096 89.87% 
Efficient Net V2-S-CA 88.31% 88.93% 89.58% 89.22% 
Efficient Net V2-S-Triplet 88.15% 88.92% 89.25% 89.05% 
Efficient Net V2-S-SE7 88.87% 89.81% 89.88% 89.24% 
EfficientNetV2-S-CBAM7 88.17% 89.08% 89.11% 89.08% 
Efficient Net V2-S-ECA7 88.82% 89.56% 89.85% 89.69% 
EfficientNetV2-S-CA7 88.69% 89.52% 89.68% 89.56% 
EfficientNetV2-S-Triplet7 89.03% 89.69% 90.21% 89.93% 

此 外 , t T EfficientNetV2-S-Triplet 7 As £r Y FE 表示 预测 标签 . FEA, 20984 WH A. S37 8H 
BOK, 模型 复杂 度 高 , 与 传统 的 ResNet-34 等 相 比 ， 核 球 侧 向 星系 、939 个 无 核 球 侧 向 星系 、1971 个 旋 
训练 时 间 方 面 没 有 明显 优势 . 但 是 , S] I ARE 涡 星 系 、1389 个 棒 旋 星系 和 1113 个 扰动 星系 被 正 
cientNetV2-S-Triplet7 所 有 层 的 权重 , 完成 一 个 MIK. 204 个 旋涡 星系 被 错 分 成 椭圆 星系 , 占 所 
epoch 的 训练 时 间 约 为 8.5 min, 快 于 EffcientNet 系 有 旋涡 星系 的 8.50%, 我 们 在 图 7 中 展示 了 6 个 示例 ; 
列 中 分 类 准确 率 最 高 的 EfficientNet-B6. 因此 在 考 138 个 椭圆 星系 被 分 成 旋涡 星系 , 占 所 有 椭圆 星系 
虑 分 类 性 能 的 前 提 下 , 我 们 所 建立 模型 的 训练 时 间 836.0396, 我 们 在 图 8 中 展示 了 6 个 示例 . 结合 图 7 和 
是 可 以 接受 的 . 图 8 我 们 观察 发 现 , 二 者 易 被 错误 分 类 是 由 一 些 旋 

为 了 清晰 直观 地 展示 我 们 构建 模型 的 测试 结 涡 星系 的 内 部 旋涡 结构 较 模 糊 且 边缘 轮廓 与 椭圆 
A, 我 们 结合 了 数目 混淆 矩阵 和 百分比 混淆 矩阵 . 星系 相似 所 致 . 

图 6 展示 了 EffhcientNetV2-S-Triplet7 在 测试 集 上 的 测试 集中 6 类 星系 模型 的 ROC 曲 线 如 图 9 所 示 . 


Z] 


混淆 和 矩阵. 


6 ( 左 ) 是 数 
分 比 混淆 矩阵 . 两 个 图 的 列 均 表 


一 ud 


H WAHRE, 图 6 ( 右 ) 是 百 


VA 


实 标签 , ATHY 
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每 个 颜色 代表 一 个 类 , 真正 例 率 (True Positive 


Rate，TPR) 值 越 接近 1 


, BIE B% (False Positive 
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仲 峥 迪 等 : Efficient Net V2-S-Triplet7: 


种 改 ; 


的 星系 形态 学 分 类 算法 


m 


Rate, FPR) 值 越 接 近 0, | 


1 线 预测 效果 越 好 , 即 曲 线 


越 接 近 左 上 角 , 曲线 预测 


效果 越 好 . 从 图 9 


中 可 以 看 


出 , 每 一 类 的 ROC 


| 线 都 表现 得 很 好 , T 


fi Ke a EE. A 


较 低 、 轮 廓 不 明显 , 另外 , 旋涡 星系 与 椭圆 星系 、 
棒 旋 星系 、 扰 动 星系 的 自身 特征 差异 较 小 . 最 后 ， 
EffhicientNetV2-S-Triplet7 模 型 的 平均 AUC 值 为 


^ XE rey, wpe sz ^2: +e ` eu 
的 预测 相对 较 差 , 这 是 由 于 旋涡 星系 的 图 像 分 辨 率 0.9805, 表明 该 模型 的 整体 预测 性 能 良好 . 
Confusion Matrix Percent Confusion Matrix 
ME 2098 9 0 138 28 17 2000 
0 0.39% 0.0096 6.03% 1.22% 0.74% 
1750 s 
14 ? 2 22 : s 1508 14 0.98% A 4.26% 0.33% 0.44% 
0.6 
212 27 2 0 0 1250 >g oD 10.0056 
a 2 
& © 
9 上 1000 T 
已 P 
E34 204 27 7 1971 5 96 E 34 8.50% 82.12% 4.00% 0.4 
H750 
44 28 12 7 109 44 mA à 0.44% 
0.2 
59 21 | 250 
54 10 8 2 54 0.82% 0.66% 0.16% 4.86% 1.73% [Emir 
r ， r r r 0 0.0 
0 1 2 3 4 5 0 1 2 3 4 5 
Pre result Pre result 
图 6 ”EfficientNetV2-S-Triplet7 分 类 结果 的 数目 混淆 矩阵 ( 左 ) 和 百分比 混淆 矩阵 ( 右 ) 


Fig.6 Number confusion matrix (left) and percent confusion matrix (right) for Efficient NetV2-S-Triplet7 classification results 


Al 7 


真实 标签 为 旋涡 星系 ,预测 结果 为 椭圆 


星系 的 图 像 示 例 . 


Fig.7 Example images where the true label is a spiral galaxy and the predict result is an elliptical galaxy. 
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图 8 真实 标签 为 椭 区 


星系 , 预测 结果 为 旋涡 星系 的 图 像 示 例 . 


Fig.8 Example images where the true label is an elliptical galaxy and the predict result is a spiral galaxy. 


验 表 明 , EffcientNetV2 有 更 高 的 分 类 准确 率 . 其 中 

pfficientNetV2-S 在 椭圆 星系 、 有 核 球 侧 向 星系 、 

无 核 球 侧 向 星系 、 旋涡 星系 、 棒 旋 星 系 和 扰动 星 

系 6 分 类 任务 上 表现 出 最 好 的 分 类 准确 率 、 查 准 
E 率 、 查 全 率 和 F1 分 数 . 本 文 还 采用 了 尺寸 拌 动 、 翻 
£ , 转 、 色 彩 畸 变 等 图 像 增 强手 段 来 提高 天 文 图 像 后 
zi JU RURAL 期 处理 的 质量 , 然后 在 该 模型 的 stage7 的 1 x 1% 
s Pa — o 积 层 后 加 入 相对 较 优 的 Triplet 注 意 力 模块 , 最 终 
" d NE 在 93758 张 测试 星系 图 片 的 准确 率 、 查 全 率 、F1 分 

E. E jet Average ROC cuve (AUC = 0.9805) 数 方面 均 优 于 本 文 其 他 模型 ，3 项 指标 值 分 别 为 
ou M wa a D Pa 89.0396. 90.2196. 89.93%. 然而 , 由 于 旋涡 星系 与 


False Positive Rate 


图 9 BEBHcientNetv2_9-Triplet7 分 类 结果 ROC 曲 线 椭圆 星系 、 棒 旋 星 系 、 扰 动 星系 边缘 相似 , 错 分 比 

Fig.9 ROC for EfficientNetV2-S-Triplet7 classification 例 较 高 . 同时 , 星系 测 光 图 像 分 辩 率 与 ImageNet 传 
results 统 图 像 相 比分 辩 率 更 低 , 分 类 比较 困难 . 因此 , 下 

一 阶段 将 致力 于 提高 图 像 细 粒度 , 进一步 增强 网 

5 ”结论 络 的 特征 提取 能 力 , 力争 取得 更 好 的 分 类 效果 . 
a 另 一 方面 , 本 文 数据 来 自 地 基 望 远 镜 , 其 更 易 受 
随 着 天 文 观测 技术 和 设备 的 不 断 进步 , 自动 到 大 气 干 扰 的 影响 , 所 以 数据 质量 低 于 空间 望 远 
化 分 析 海 量 天 文 数 据 越 来 越 受 到 重视 . AE- 镜 拍 摄 的 数据 . 那么 将 我 们 的 模型 应 用 于 空间 望 
cientNetV2 网 络 应 用 于 星系 形态 学 分 类 数据 集 远 镜 的 数据 中 , 也 可 能 取得 较 好 的 星系 形态 分 类 
第 二 期 星系 动物 园 中 , 并 与 经 典 模型 AlexNet、 效果 . 近年 来 , 一 些 学 者 致力 于 对 DES (the Dark 
ResNet-34、 MobileNetV2 和 RegNet 进 行 对 比 , 实 Energy Survey)5 中 的 低 表 面 亮度 星系 (Low Sur- 


Shttps: //www.darkenergysurvey.org/ 
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仲 峥 迪 等 : EfficientNetV2-S-Triplet7: 一 种 改进 的 星系 形态 学 分 类 算法 2 其 


face Brightness Galaxy, LSBG) 进 行 


区 态 分 类 , 在 


未 来 的 工作 中 , 我 们 尝试 基于 本 文 模型 解决 该 问 


题 . 
era Legacy Survey)" 数据 相似 度 较 高 , 因 
虑 将 本 文 改 进 的 模型 应 用 在 DeCaLS 的 星系 形态 分 
类 问题 中 , 并 党 试 更 多 类 别 的 星系 形态 分 类 在 


Ari 


此 外 , GZ2 与 DeCaLS (the Dark Energy Cam- 
此 我 们 考 


Zn 


F. 
我 们 将 在 实现 


步 保 证 模型 的 分 类 性 能 ， 


述 应 用 程序 的 同时 优化 其 架构 和 超 参数 . 


QO Ja OA O N el 
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Efficient Net V2-S-Triplet7: An Improved Algorithm for 
Morphological Galaxy Classification 


ZHONG Zheng-di TU Liang-ping FENG Xue-qi LI Juan LI Xin 
(School of Science, University of Science and Technology Liaoning, Anshan 114051) 


Asstract The morphology of galaxies is closely related to the formation and evolution of galaxies, and 
its morphological classification is a significant part of the follow-up research of galaxy astronomy. With 
the emergence of massive astronomical observation data, the automatic analysis of astronomical data has 
attracted more and more attention. To solve this problem, the advanced deep learning backbone network 
EfficientNet V2 is utilized to analyze the effects of different attention mechanism types and usage nodes on 
network performance, and an improved algorithm model named EfficientNet V2-S-Triplet7 is constructed 
to realize automatic classification of galaxy morphology. More than 240 thousand photometric images 
from Galaxy Zoo 2 are used as initial data for experimental tests. In the process of data preprocessing, 
image enhancement methods such as size jittering, flipping and color distortion are adopted to solve the 
problem of image number imbalance. After conducting comparative experiments on the same series of 
classic and cutting-edge deep learning algorithms AlexNet, RegNet, MobileNetV2 and ResNet-34, it is 
concluded that the EfficientNet V2-S- Triplet7 algorithm has the best test results in classification accuracy, 
recall and F1-score. In 9375 test images, the three index values can reach 89.03%, 90.21% and 89.93%, 
respectively, and the precision can reach 89.6996, ranking the third among other models. The results show 
that EfficientNetV2-S-Triplet7 algorithm can be effectively applied to the morphological classification of 
large-scale galaxy data. 


Key words techniques: image processing, methods: data analysis, methods: classification, galaxies: struc- 
ture 
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